Reutilización de conocimiento en meta-aprendizaje por refuerzo
Marco de meta-RL reutiliza conocimiento entre agentes heterogéneos: reduce errores de seguimiento hasta un 99.79% con solo 23.8% de datos.
Marco de meta-RL reutiliza conocimiento entre agentes heterogéneos: reduce errores de seguimiento hasta un 99.79% con solo 23.8% de datos.